import os
import pandas as pd

dir = 'files'
target = 'all.xlsx'

if __name__ == '__main__':
    res = []
    for file_name in os.listdir(dir):
        if (file_name.startswith('.') or file_name.endswith('.')):
            continue
        print(dir+"/"+file_name)

        # 读取第一列、第二列、第四列
        df = pd.read_excel(dir+"/"+file_name,sheet_name=0)
        for i in range(1000):
            try:
                line = df.loc[i+2]
                l = []
                l.append(file_name)
                for c in range(14):
                    l.append(str(line[c]))
                res.append(l)
            except:
                break

    print(res)

    writer = pd.ExcelWriter(target)
    df = pd.DataFrame(res)
    df.columns = ['文件名', '序号', '所属街镇、开发区、系统和直属单位工会',
                  '劳模类型（市模、全模、享受市模待遇者、享受全模待遇者）', '劳模姓名', '政治面貌', '劳模身份证号',
                  '劳模本人手机号', '现工作单位及职务', '就业状态', '本人常住地址', '收货人姓名', '收货人手机号',
                  '收货人地址', '是否全国五一劳动奖章获得者']
    df.to_excel(writer, sheet_name="all", index=False)
    try:
        writer.save()
        writer.close()
    except:
        pass